检索结果

Select

1. 基于场景图感知的跨模态图像描述模型

朱志平, 杨燕, 王杰

《计算机应用》唯一官方网站 2024, 44 (1): 58-64. DOI: 10.11772/j.issn.1001-9081.2022071109

摘要（262）

HTML （4）

PDF （1879KB）（173）

针对图像描述方法中对图像文本信息的遗忘及利用不充分问题，提出了基于场景图感知的跨模态交互网络（SGC-Net）。首先，使用场景图作为图像的视觉特征并使用图卷积网络（GCN）进行特征融合，从而使图像的视觉特征和文本特征位于同一特征空间；其次，保存模型生成的文本序列，并添加对应的位置信息作为图像的文本特征，以解决单层长短期记忆（LSTM）网络导致的文本特征丢失的问题；最后，使用自注意力机制提取出重要的图像信息和文本信息后并对它们进行融合，以解决对图像信息过分依赖以及对文本信息利用不足的问题。在Flickr30K和MS-COCO （MicroSoft Common Objects in COntext）数据集上进行实验的结果表明，与Sub-GC相比，SGC-Net在BLEU1 （BiLingual Evaluation Understudy with 1-gram）、BLEU4 （BiLingual Evaluation Understudy with 4-grams）、METEOR （Metric for Evaluation of Translation with Explicit ORdering）、ROUGE （Recall-Oriented Understudy for Gisting Evaluation）和SPICE （Semantic Propositional Image Caption Evaluation）指标上分别提升了1.1、0.9、0.3、0.7、0.4和0.3、0.1、0.3、0.5、0.6。可见，SGC-Net所使用的方法能够有效提升模型的图像描述性能及生成描述的流畅度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 深度融合多视图聚类网络

何子仪, 杨燕, 张熠玲

《计算机应用》唯一官方网站 2023, 43 (9): 2651-2656. DOI: 10.11772/j.issn.1001-9081.2022091394

摘要（477）

HTML （47）

PDF （1074KB）（365）

现有的深度多视图聚类方法存在以下缺点：1）在对单一视图进行特征提取时，只考虑了样本的属性信息或结构信息，而没有将二者进行融合，导致提取到的特征不能充分表示原始数据的潜在结构；2）将特征提取与聚类划分为两个独立的过程，没有建立两者间的联系，因此无法利用聚类过程优化特征提取过程。针对以上问题，提出一种深度融合多视图聚类网络（DFMCN）。首先，结合自编码器和图卷积自编码器融合样本的属性信息和结构信息，获取每个视图的嵌入空间；然后，通过加权融合获取融合视图嵌入空间并在此空间中进行聚类，并且在聚类过程中采用双层自监督机制优化特征提取过程。在FM（Fashion-MNIST）、HW（HandWritten numerals）、YTF（YouTube Face）数据集上的实验结果表明：DFMCN的准确率高于所有对比方法；在FM数据集上，DFMCN的准确率比次优的CMSC-DCCA（Cross-Modal Subspace Clustering via Deep Canonical Correlation Analysis）方法提高了1.80个百分点，标准化互信息（NMI）高于除CMSC-DCCA和DMSC（Deep Multimodal Subspace Clustering networks）的所有方法1.26~14.84个百分点。实验结果验证了所提方法的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于伪标签一致度的不平衡数据特征选择算法

李懿恒, 杜晨曦, 杨燕燕, 李翔宇

《计算机应用》唯一官方网站 2022, 42 (2): 475-484. DOI: 10.11772/j.issn.1001-9081.2021050957

摘要（394）

HTML （22）

PDF （921KB）（115）

针对大多数粒计算特征选择算法未考虑数据的类别不平衡性的问题，提出一种融合伪标签策略的类别不平衡数据特征选择算法。首先，为了便于研究类别不平衡数据特征选择算法，重新定义样本和数据集一致度的概念，并设计了相应特征选择的贪婪前向搜索算法；其次，引入伪标签策略以平衡数据的类别分布，并将所学样本的伪标签融入一致性测度中，以构造伪标签一致度来估计类别不平衡数据集的特征；最后，通过保持类别不平衡数据集的伪标签一致度不变，设计一种面向类别不平衡数据的基于伪标签一致性的特征选择算法（PLCFS）。实验结果表明，所提PLCFS的性能仅次于最大相关最小冗余（mRMR）算法，而优于Relief算法和基于一致性的特征选择算法（CFS）。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于图卷积网络的迁移学习轴承服役故障诊断

彭雪莹, 江永全, 杨燕

《计算机应用》唯一官方网站 2021, 41 (12): 3626-3631. DOI: 10.11772/j.issn.1001-9081.2021060974

摘要（355）

HTML （8）

PDF （561KB）（260）

深度学习方法被广泛应用于轴承故障诊断，但在实际工程应用中，轴承服役期间的真实服役故障数据不易收集，缺乏数据标签，难以进行充分的训练。针对轴承服役故障诊断困难的问题，提出了一种基于图卷积网络（GCN）的迁移学习轴承服役故障诊断模型。该模型从数据充足的人工模拟损伤故障数据中学习故障知识，并迁移到真实的服役故障上，以提高服役故障的诊断准确率。具体来说，通过将人工模拟损伤故障数据和服役故障数据的原始振动信号由小波变换转换为同时具有时间和频率信息的时频图，并将得到的时频图输入到图卷积层中进行学习，从而有效地提取源域和目标域的故障特征表示；然后计算源域和目标域的数据分布之间的Wasserstein距离来度量两个数据分布之间的差异，通过最小化数据分布差异，构建了一个能诊断轴承服役故障的故障诊断模型。在不同的轴承故障数据集和不同工作条件下设计了多种不同的任务进行实验，实验结果表明，该模型具有诊断轴承服役故障的能力，同时也能从一个工作条件迁移到另一工作条件，在不同组件类型和不同工作条件之间进行故障诊断。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 基于指针网络的抽取生成式摘要生成模型

陈伟, 杨燕

《计算机应用》唯一官方网站 2021, 41 (12): 3527-3533. DOI: 10.11772/j.issn.1001-9081.2021060899

摘要（290）

HTML （9）

PDF （562KB）（81）

作为自然语言处理中的热点问题，摘要生成具有重要的研究意义。基于Seq2Seq模型的生成式摘要模型取得了良好的效果，然而抽取式的方法具有挖掘有效特征并抽取文章重要句子的潜力，因此如何利用抽取式方法来改进生成式方法是一个较好的研究方向。鉴于此，提出了融合生成式和抽取式方法的模型。首先，使用TextRank算法并融合主题相似度来抽取文章中有重要意义的句子。然后，设计了融合抽取信息语义的基于Seq2Seq模型的生成式框架来实现摘要生成任务；同时，引入指针网络解决模型训练中的未登录词（OOV）问题。综合以上步骤得到最终摘要，并在CNN/Daily Mail数据集上进行验证。结果表明在ROUGE-1、ROUGE-2和ROUGE-L三个指标上所提模型比传统TextRank算法均有所提升，同时也验证了融合抽取式和生成式方法在摘要生成领域中的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于医疗文本数据聚类的帕金森病早期诊断预测

张晓博, 杨燕, 李天瑞, 陆凡, 彭莉兰

计算机应用 2020, 40 (10): 3088-3094. DOI: 10.11772/j.issn.1001-9081.2020030359

摘要（411）

PDF （1270KB）（826）

针对多发于老龄人群的帕金森病（PD）的早期智能化诊断的问题，提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先，对原始数据集进行预处理以获取有效特征信息，并通过主成分分析（PCA）方法将原始特征分别降维到8个不同维度的维度空间；然后，应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类；最后，采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失（SWEDD） PD患者。仿真结果显示，PCA特征维度值取30时，高斯混合模型（GMM）的聚类准确度达到89.12%；PCA特征维度值取70时，谱聚类（SC）的聚类准确度达到61.41%；PCA特征维度值取80时，元聚类算法（MCLA）的聚类准确度达到59.62%。对比实验结果表明，5种经典聚类方法中，PCA的特征维度值小于40时，高斯混合模型聚类效果最佳；3种聚类集成方法中，对于不同的特征维度，MCLA的聚类性能均表现优异，进而为PD的早期智能化辅助诊断提供了技术和理论支撑。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于高阶近似的链路预测算法

杨燕琳, 冶忠林, 赵海兴, 孟磊

计算机应用 2019, 39 (8): 2366-2373. DOI: 10.11772/j.issn.1001-9081.2019010213

摘要（577）

PDF （1295KB）（297）

目前大部分链路预测算法只研究了节点与邻居节点之间的一阶相似性，没有考虑节点与邻居的邻居节点之间的高阶相似性关系。针对此问题，提出一种基于高阶近似的链路预测算法（LP-HOPA）。首先，求出网络的归一化邻接矩阵和相似度矩阵；其次，利用矩阵分解的方法将相似度矩阵进行分解，得到网络节点的表示向量以及其上下文的表示向量；然后，通过高阶网络表示学习的网络嵌入更新（NEU）算法对原始相似度矩阵进行高阶优化，并利用归一化的邻接矩阵计算出更高阶的相似度矩阵表示；最后，在四个真实的数据集上进行大量的实验。实验结果表明，与原始链路预测算法相比，大部分利用LP-HOPA优化后的链路预测算法准确率提升了4%到50%。此外，LP-HOPA算法能够将基于低阶网络局部结构信息的链路预测算法转换为基于节点高阶特征的链路预测算法，在一定程度上肯定了基于高阶近似链路预测算法的有效性和可行性。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于增强特征判别性的典型相关分析和分类集成的助学金预测方法

张芳娟, 杨燕, 杜圣东

计算机应用 2018, 38 (11): 3150-3155. DOI: 10.11772/j.issn.1001-9081.2018041259

摘要（348）

PDF （893KB）（351）

针对高校资助管理办法效率低下、工作量大等问题，提出一种增强特征判别性的典型相关分析（EN-DCCA）方法，并结合分类集成方法实现高校学生助学金预测。将学生在校多维度数据划分为两个不同视图，已有的各种多视图判别典型相关分析算法没有综合考虑视图类别之间的相关性和视图组合特征的判别性两者因素。EN-DCCA的优化目标在最大化类内相关的同时最小化类间相关，并且考虑了视图组合特征的判别性，进一步强化了属性的判别性能，更有利于分类预测。高校学生助学金预测的实现过程：首先，根据学生生活行为和学习表现将数据预处理为两个不同视图，然后用EN-DCCA方法对这两个视图数据进行特征学习，最后用分类集成方法完成预测。在真实的数据集上进行实验，所提方法的预测准确率达到90.01%，较增强视图组合特征判别性的典型相关分析（CECCA）的集成方法提高了2个百分点，实验结果表明，所提方法能有效实现高校助学金预测。

参考文献 | 相关文章 | 多维度评价

Select

9. 结合透射率和大气光改进的暗原色先验去雾算法

陈高科, 杨燕, 张宝山

计算机应用 2017, 37 (5): 1481-1484. DOI: 10.11772/j.issn.1001-9081.2017.05.1481

摘要（629）

PDF （851KB）（426）

针对暗原色先验透射率在明亮区域估计不足以及大气光误差问题，提出一种结合透射率和大气光改进的去雾算法。在分析高斯函数特点的基础上，依据有雾图像暗原色的高斯函数初步估计透射率，利用最大最小操作消除块状效应；然后，通过晕光算子与形态学膨胀操作获取大气光描述区域来获取大气光值；最后根据大气散射模型复原清晰图像。实验结果表明，所提算法能够有效去除图像中的雾气，浓雾图像恢复效果相比暗原色先验等算法更佳，且处理速度较快，便于实时应用。

参考文献 | 相关文章 | 多维度评价

Select

10. 基于导向图优化的单幅图像深度去雾算法

董宇飞, 杨燕, 曹碧婷

计算机应用 2017, 37 (1): 268-272. DOI: 10.11772/j.issn.1001-9081.2017.01.0268

摘要（673）

PDF （1081KB）（414）

针对雾霾等天气条件下获取的图像出现对比度下降、颜色失真等降质现象，提出一种基于导向图优化的单幅图像深度去雾算法。该算法在对大气散耗函数特性进行分析的基础上，引入图像局部均值和标准差优化导向图；再进一步对导向图进行分区域滤波，得到平滑且边缘清晰的导向图；然后采用快速引导滤波估计大气散耗图；最后根据大气散射物理模型恢复清晰图像。实验结果表明，恢复的图像清晰自然，细节丰富，近景去雾彻底，远景去雾有很大提升，在景深突变处的边缘取得较好的效果，提高了户外视觉系统的视见度和鲁棒性。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于相对透射率估计的快速图像去雾算法

杨燕, 王帆, 白海平

计算机应用 2016, 36 (3): 806-810. DOI: 10.11772/j.issn.1001-9081.2016.03.806

摘要（589）

PDF （904KB）（358）

针对暗通道先验算法中恢复效果偏暗以及运算时间过久的问题,提出一种基于相对透射率估计的单幅图像快速去雾算法。该算法在分析雾霾条件下场景深度与最小值图像关系的基础上,依据景深相对量初步估计透射率,利用改进的均值滤波器作精确化调整,最后根据大气散射模型复原清晰图像,并通过亮度增强改善其视觉效果。该算法对透射率的估计简单、有效,复原图像清晰、自然,并且具有较高的细节可见度和层次感。实验结果表明,该算法在去雾效果和处理速度方面均有很大改善,有利于实现实时性应用。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于Hadoop平台的并行DHP数据分析方法

杨燕霞, 冯林

计算机应用 2016, 36 (12): 3280-3284. DOI: 10.11772/j.issn.1001-9081.2016.12.3280

摘要（624）

PDF （830KB）（385）

由候选项集 C ₂生成频繁2-项集 L ₂是关联规则Apriori算法的一个瓶颈。直接哈希修剪（DHP）算法利用一个生成的Hash表 H ₂删减 C ₂中无用的候选项集，以此提高 L ₂的生成效率。但传统DHP算法是一个串行算法，不能有效处理较大规模数据。针对这一问题，提出DHP的并行化算法——H_DHP。首先，对DHP算法并行化策略的可行性进行了理论分析与证明；其次，基于Hadoop平台，把Hash表 H ₂的生成以及频繁项集 L ₁、 L ₃~ L _k的生成方法进行了并行实现，并借助Hbase数据库生成关联规则。仿真实验结果表明：与传统DHP算法相比，H_DHP算法在数据的处理时间效率、处理数据集的规模大小，以及加速比和可扩展性等方面都有较好的性能。

参考文献 | 相关文章 | 多维度评价

Select

13. 基于物理模型的单幅图像对比复原算法

王帆, 杨燕, 白海平

计算机应用 2015, 35 (8): 2291-2294. DOI: 10.11772/j.issn.1001-9081.2015.08.2291

摘要（485）

PDF （912KB）（345）

基于图像复原的去雾算法中参数的估计容易造成去雾图像场景信息的丢失,对此,提出一种图像去雾新算法。在暗通道先验的基础上,通过对大气散射模型的分析,总结出雾气分布对暗通道图像的影响,并依此对外景图像进行加雾操作,利用加雾后的参考图像与外景图像中各点的景深关系完成透射率的估计,进而达到去雾目的。算法利用物理模型和多幅图像实现参数的估计,能够更好地保留场景信息。实验结果表明,该算法不仅去雾效果优于对比算法,在处理速度上也有明显改善。

参考文献 | 相关文章 | 多维度评价

Select

14. 基于语义扩展的短问题分类

冶忠林, 杨燕, 贾真, 尹红风

计算机应用 2015, 35 (3): 792-796. DOI: 10.11772/j.issn.1001-9081.2015.03.792

摘要（566）

PDF （789KB）（556）

问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题模型进行特征词选择;最后,利用词语相似度计算获取问题的类别。实验结果表明,所提方法在1365条真实问题集上平均F-measure值达到0.713,其值高于支持向量机(SVM)、K近邻(KNN)算法和最大熵方法。因此,该方法在问答系统中可以帮助系统提升问题分类的准确率。

参考文献 | 相关文章 | 多维度评价

Select

15. 基于计算统一设备架构的高铁故障诊断方法

陈志, 李天瑞, 李明, 杨燕

计算机应用 2015, 35 (10): 2819-2823. DOI: 10.11772/j.issn.1001-9081.2015.10.2819

摘要（409）

PDF （703KB）（407）

为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,最后利用最近邻分类(KNN)算法对多个模糊熵特征组成的特征空间进行故障分类。实验结果表明,该方法能高效地对高铁振动信号进行故障分类,运行速度较传统方法有明显提高。

参考文献 | 相关文章 | 多维度评价

Select

16. 基于心跳超时机制的Hadoop实时容错技术

关国栋, 滕飞, 杨燕

计算机应用 2015, 35 (10): 2784-2788. DOI: 10.11772/j.issn.1001-9081.2015.10.2784

摘要（471）

PDF （754KB）（385）

针对官方的Hadoop软件中提供的节点心跳超时容错机制对短作业并不合理,而且忽略了异构集群中各节点超期时间设置的公平性的问题,提出了公平心跳超时容错机制。首先根据每个节点的可靠性及计算性能构建节点故障误判损失模型,提出公平误判损失(FMJL)算法,使其同时满足长作业和短作业要求;接着,设计并实现了基于FMJL算法的公平超时机制。在实现了公平超时机制的Hadoop上运行大约345 s的短作业时,当出现TaskTracker节点故障时作业完成时间平均大约节省了44%,与自适应超时机制相比,作业完成时间大约节省了23%。实验结果表明,公平超时机制在保证不影响长作业完成时间的情况下缩短了短作业的容错处理时间,提高了Hadoop的实时处理效率。

参考文献 | 相关文章 | 多维度评价

Select

17. 基于规则的汉语兼类词标注方法

李华栋贾真尹红风杨燕

计算机应用 2014, 34 (8): 2197-2201. DOI: 10.11772/j.issn.1001-9081.2014.08.2197

摘要（209）

PDF （746KB）（358）

针对目前汉语兼类词标注的准确率不高的问题，提出了规则与统计模型相结合的兼类词标注方法。首先，利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注；然后，将改进的互信息算法应用到词性(POS)标注规则的获取上，通过计算目标词前后词单元与目标词的相关性获得词性标注规则；最后，将获取的规则与基于统计模型的词性标注算法结合起来进行兼类词标注。实验结果表明加入规则算法之后，平均词性标注准确率提升了5%左右。

参考文献 | 相关文章 | 多维度评价

Select

18. 智慧轨道交通——实现更深入的智能化

杨燕朱焱戴齐李天瑞

计算机应用 2012, 32 (05): 1205-1207.

摘要（1602）

PDF （2286KB）（1174）

当前轨道交通已成为居民出行的重要交通工具之一。智慧轨道交通的核心是要通过现代信息技术以一种更加智慧的方法来改变现有轨道交通方式，为人类社会活动带来更加快捷、安全、舒适的智慧交通系统。讨论了智慧轨道交通中更深入的智能化的四个关键步骤：数据智慧采集、数据智慧融合、数据智慧挖掘和智慧决策。这四个步骤形成一个螺旋上升的智能信息处理过程，最终可以达到智慧轨道交通更深入的智能化目的。

参考文献 | 相关文章 | 多维度评价

Select

19. 基于数据流频繁闭合模式的挖掘

荣文亮杨燕

计算机应用

摘要（1685）

PDF （636KB）（892）

用挖掘频繁闭合模式集代替挖掘频繁模式集是近年来提出的一个重要策略。根据数据流的特点，提出了一种基于滑动窗口的频繁闭合模式的新方法DSFC_Mine。该算法以滑动窗口中的基本窗口为更新单位，利用改进的CHARM算法计算每个基本窗口的潜在频繁闭合项集，将它们存储到一种新的数据结构中，利用该数据结构可以快速地挖掘滑动窗口中的所有频繁闭合项集。实验验证了该算法在时间上和空间上的可行性和有效性。